#18 : Alteryxサンプルワークフロー「市場バスケット分析」- Alteryx & Tableau 連携 Advent Calendar 2018
当エントリは『Alteryx&Tableau連携 Advent Calendar 2018』シリーズの18本目のエントリです。
- Alteryx & Tableau 連携 Advent Calendar 2018 - Qiita
- Alteryx & Tableau 連携 Advent Calendar 2018 | シリーズ | DevelopersIO
当エントリでは、Alteryx Designerの実行ワークフローサンプル「Market Basket Analysis(市場バスケット分析)」の内容を紹介します。
目次
「本日のテーマ」概要紹介
AlteryxとTableauはそのツール特性から非常に相性が良く、製品間それぞれにパートナー企業としての(特集)ページが設けられています。
本日は、Alteryx Designerの「Sample Workflows」にて展開されている「Tableau Starter Kit」の中で、「Predictive Analytics」配下の「Market Basket Analysis」というサンプルワークフローについて見ていきたいと思います。
このワークフローでは、「MB Rules」と「MB Inspect」というマーケット分析に関するツールを用いてバイヤーの購入行動を分析し、結果をTableauワークブックにエクスポートする手法について言及されています。「バスケット分析」とは、データマイニングで用いられる解析手法の一つで、"よく一緒に買われる商品" を見つけるためのデータ分析手法です。「ビールを購入した人はオムツも一緒に購入している」という例えが良く使われるアレですね。
ワークフローの全体像
サンプルワークフローの全体像は以下となります。
ワークフローを読み解く
入力データ
Text Input Toolを介して準備された入力データ。内容としてはトランザクションID(Transaction_ID)と製品名(Item_Desc)の2項目のみとなっています。指定のトランザクションIDで括ると以下の様に品名がグルーピングされるようになっています。これらが「一緒に購入した製品である」という意味合いのデータになっているようです。
MB Rules Tool
このデータを使ってまず処理を噛ましているツールは「MB Rules Tool」となります。
MB Rules Toolでは、アプリオリというアルゴリズムを使用して、トランザクション内の他アイテム購入に関連するアイテムを表示します。このアルゴリズムの詳細については以下ページなどをご参照ください。データの相関関係を発見する際には関連(Association)を見る分析(アソシエーション分析)が用いられ、そのアソシエーション分析で用いられているアルゴリズムがこのアプリオリ・アルゴリズムとなっているようです。
MB Rules Toolの設定内容を見てみます。
入力データ構造(Input Data Structure)ではTransaction IDとItem_Descがそれぞれ指定され、使用メソッド(Method to Use)ではApriori - Association Rulesが指定されています。この方法(Apriori)を使用すると、頻出アイテムセット(Frequent itemsets)、最大頻出アイテムセット(Maximally frequent itemsets)、閉鎖頻出アイテムセット(Closed frequent itemsets)、相関ルール(デフォルト指定:Association rules)、または割当ハイパーエッジセット(Association hyperedgesets)のいずれかを見つけることができます。ここでは「相関ルール(Association Rules)」を割り出したいのでこの指定となっています。
Browse ToolをMB Rules ToolのR Outputに繋げる事で、分析結果を参照可能です。
ワークフローを実行して、レポート結果を確認してみます。以下の様な内容で詳細なレポートを参照出来ました。
MB Inspect Tool
MB Rules Toolを経て出力された内容を用い、次に処理を行うのは「MB Inspect Tool」となります。このツールは、入力としてルールを、または[MBルール]ツールのアイテムセット出力を取り込み、返されたルールまたはアイテムセットを管理可能な数に減らすために、複数の基準でフィルタリングできるこれらのツールのリストと分析を提供します。
このワークフローでは、「リフト」は、ランダムチャンスと比較して、これらの製品が一緒に購入される可能性が高いことを示しています。(※リフトとは、項目が互いに独立している場合 (無関係) に発生すると予想される時間の割合に対して、角形と左辺の項目を含むトランザクションの割合です。その他「リフト」に関する詳細は下記情報などをご参照ください。)
ツールの設定値を確認してみます。「割当の最小リフトレベル ルール」に1.2という数値が、また「関連付けルールの並べ替え」にLift(リフト)が設定されています。返されたアソシエーションルールが、またはリフトの値によって並べ替えられる形となります。
「MB Rules Tool」同様、R OutputにBrowse Toolを設定しておくと分析結果の詳細を確認することが出来ます。こちらの内容では、分析結果がLiftの値でソートされているのが分かります。相関の高い項目が確認出来ています。
続きのページではこんな情報も。条件(left hand side:lhs)と結論(right hand side:rhs)に関する情報も可視化された状態で確認出来ました。
あとはMB Inspect Toolの出力結果をTableauワークブックに繋げて終了です。
ワークフローの実行・Tableauワークブックの内容確認
画面右上の「Run」ボタン、または「Control」+「R」のショートカットでワークフローを実行。抽出ファイル(.tde)を用いたTableauワークブック(.twb)が出力されました。
出力されたTableauワークブックを開いてみます。分析結果が可視化されたVizを参照する事が出来ました。
まとめ
という訳で、『Alteryx & Tableau 連携 Advent Calendar 2018 』18本目、「Market Basket Analysis(市場バスケット分析)」のご紹介でした。
引き続き、明日もお楽しみに!
- Alteryx & Tableau 連携 Advent Calendar 2018 - Qiita
- Alteryx & Tableau 連携 Advent Calendar 2018 | シリーズ | DevelopersIO
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。